FILTER MODE ACTIVE

#безопасность ИИ

Найдено записей: 37

#безопасность ИИ18.11.2025

Grok 4.1: xAI усиливает эмоциональный интеллект, снижает галлюцинации и выходит в лидеры

'Grok 4.1 занимает верхние позиции на LMArena, улучшает воспринимаемую полезность и снижает галлюцинации в быстрых ответах, но требует внимания к росту обмана и сыкопанства.'

#безопасность ИИ

Grok 4.1: xAI усиливает эмоциональный интеллект, снижает галлюцинации и выходит в лидеры

Новый прозрачный LLM OpenAI показывает, как «думает» ИИ

Apna запускает BlueMachines.ai — многоязычный голосовой ИИ для миллионов звонков

Сенаторы предлагают закон о проверке рисков ИИ под контролем Минэнерго

Как снизить риски инвестиций в агентные ИИ для клиентского сервиса

Правительства меняют правила для ИИ: начинается новая эпоха политики

Антибиотики, разработанные ИИ, дают надежду, но риски остаются

Когда Клод сыграл ХАL: что на самом деле показал эксперимент Anthropic

Anthropic AI представила векторные персоны для контроля изменений личности в больших языковых моделях

Новые протоколы помогут ИИ-агентам эффективно управлять цифровыми задачами

Обучение LLM с «злыми» паттернами может сделать их безопаснее

Внутри OpenAI: Дуэт, ведущий прорывные исследования и инновации в ИИ

Обеспечение безопасности и доверия: создание надежных ограничений для больших языковых моделей

Катастрофа Vibe Coding на Replit: Можно ли доверять ИИ для создания надежных продакшен-приложений?

Протокол Model Context (MCP) меняет безопасную интеграцию ИИ с AWS, Azure и Google Cloud в 2025 году

AegisLLM: революция в безопасности LLM с помощью адаптивных мультиагентных систем на этапе вывода

Как отслеживать взаимодействия агентов OpenAI с помощью MLflow

Anthropic представляет целевой фреймворк прозрачности для передовых ИИ-систем

Исследование Anthropic показывает, как ИИ модели ведут себя как внутренние угрозы в корпоративных симуляциях

Готовы ли мы доверить ИИ-агентам управление реальным миром?

Пентагон сокращает ключевую команду по тестированию ИИ и оружейных систем

Революция в ИИ: как инструменты расширяют возможности языковых моделей в рассуждениях, памяти и автономии

Закладывая доверие как основу будущего ИИ

Внутри инноваций ИИ: Райан Рис о масштабировании корпоративного ИИ с Mission и AWS

Как успешно внедрить ИИ в компании для реальной бизнес-выгоды

Шокирующий эксперимент Claude 4.0 с шантажом раскрывает опасности ИИ

Microsoft представляет Magentic-UI: открытый AI-агент для совместного выполнения сложных веб-задач

Как шлюзы MCP обеспечивают безопасную и масштабируемую интеграцию ИИ в корпоративной среде

Раскрывая Черный Ящик: Пояснимость Искусственного Интеллекта

Исследование Anthropic выявляет недостатки объяснений Chain-of-Thought в ИИ

Как заставить языковые модели обсуждать «рискованные» темы: набор данных FalseReject

Взлом систем текст-видео с помощью переформулированных запросов

OpenAI выпускает HealthBench: открытый бенчмарк для оценки работы и безопасности ИИ-моделей в медицине

Enkrypt AI выявляет критические уязвимости в передовых мультимодальных моделях

Исследователи из MIT выявляют ограничения вложенного контроля ИИ с помощью новой модели на основе рейтинга Эло

Голос ChatGPT превратился в демонический: пользователи сравнивают с фильмом ужасов

Sentra привлекла $50 млн для борьбы с рисками теневых данных в компаниях с ИИ